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Р1зн! шдходи керування рухом мо@льних роботв 
на основ! техноломй м’яких обчислень 


В статье рассматривается использование различных типов интеллектуальных алгоритмов на основе 
технологий мягких вычислений: искусственных нейронных сетей (НС), нечеткой логики (НЛ) и 
генетических алгоритмов (ГА) для реализации планирования и управления движением мобильных 
роботов. Представлены результаты моделирования и выделены ключевые особенности использования 
рассматриваемых подходов. 

Ключевые слова: планирование, мобильный робот, мягкие вычисления, нейронная сеть, не- 
четкая логика, генетические алгоритмы. 
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Введение 


Одним из актуальных направлений современных исследований В робототехнике 
является решение проблем анализа и синтеза интегрированных систем для коллектив- 
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ного управления групповым взаимодействием роботов, функционирующих в условиях 
неопределенности. Особый интерес представляет разработка методов, позволяющих 
найти приемлемые решения проблемы группового управления, и методик использо- 
вания интеллектуальных адаптивных алгоритмов для управления мобильными роботами 
в динамически изменяющихся условиях и при наличии стохастических процессов во 
внешней среде. Алгоритмы синтеза интеллектуальных систем управления-планиро- 
вания должны строиться с учетом характерных особенностей объекта управления: 
многосвязности, нелинейности, многомерности и стохастичности поведения. В связи 
с вышесказанным, для реализации систем планирования и управления движением 
мобильными роботами перспективным является использование систем управления, 
включающих различные типы интеллектуальных алгоритмов на основе технологий 
мягких вычислений: искусственных нейронных сетей, нечеткой логики и эволюцион- 
ных алгоритмов [1-3]. 

Применение известных методик для реализации мультиагентного управления 
(планированием) согласованным движением нескольких роботов и особенно больших 
коллективов не всегда реализуемо, что связано с резко возрастающей вычислительной 
нагрузкой на бортовые вычислительные системы при увеличении количества действу- 
ющих агентов. Поэтому методы и алгоритмы планирования и управления групповыми 
действиями микророботов должны изначально разрабатываться с учетом необходи- 
мости их реализации в реальном времени на основе имеющихся достаточно скромных 
вычислительных ресурсов. Таким образом, актуальной проблемой является разработка 
эффективных подходов, которые предоставили бы возможность строить быстродейст- 
вующие системы управления-планирования для решения широкого класса задач управ- 
ления мобильными роботами, действующими в составе групп в реальных средах. 

Целью данной работы является анализ современных интеллектуальных алго- 
ритмов планирования движений мобильных роботов, выделение основных этапов реше- 
ния задачи планирования на их основе и выработка рекомендаций по использованию 
того или иного метода в зависимости от требований, предъявляемых к быстродействию 
алгоритма, качеству траектории, наличию (объему) сенсорной информации. 


Обзор интеллектуальных алгоритмов планирования 


В настоящее время одним из перспективных подходов, который позволяет доста- 
точно эффективно управлять сложными динамическими объектами в условиях неопре- 
деленности, дефицита ресурсов и в реальном времени, являются системы принятия 
решений с элементами искусственного интеллекта, в частности генетические алгоритмы. 

Решение задачи планирования на основе генетических алгоритмов можно свести 
к следующим основным этапам [4]: 

1) формирование модели внешней среды (рабочего пространства); 

2) кодирование потенциальных решений (формирование хромосом); 

3) генерация начальной популяции (траекторий, соединяющих точки старта и цели); 

4) определение критериев выживания популяции на каждом эволюционном этапе 
и формирование функций соответствия; 

5) нахождение оптимального решения на каждом этапе эволюции путем вычис- 
ления функции пригодности. 

Формирование модели внешней среды заключается в разбиении (дискретизации) 
рабочей области в трехмерном пространстве по осям координат Х, У и времени (1. 
Шаг квантования по времени кратен периоду, в котором определено движение пре- 
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пятствий в рабочей области, задавая таким образом максимальную глубину планирова- 
ния по времени. Квантование по осям координат необходимо для фиксации состояния 
(положения) неподвижных объектов, определения точек, соответствующих стартовым 
и конечным положениям агента, а также для определения моментов изменения сос- 
тояния нестационарной рабочей среды. 

Наибольшее влияние на эффективность генетического алгоритма оказывает метод 
кодирования потенциальных решений, то есть формирование хромосом. Если в каче- 
стве индивидуумов рассматривать маршруты движения по ячейкам дискретного трех- 
мерного рабочего пространства, то хромосома будет представлять собой последова- 
тельность узлов, образующих траекторию движения. При этом каждый 1-й узел будет 
содержать гены, представляющие собой координаты в виде индексов (координат) х: 
и у соответствующей ячейки, а также индекс момента времени &, при наступлении 
которого агент достигнет этой ячейки. Гены, кодирующие моменты времени и рас- 
положенные в последовательных узлах хромосомы, отличаются на единицу. 

Главным требованием при выборе оптимального решения на каждом этапе эво- 
люции является его соответствие следующему неравенству: Эшах ; > Этах #1 ГДе Эшах / И 
Утах 1 — Максимальные значения критериев выживания на 1-м и (1—1)-м эволюционных 
этапах. В качестве функции пригодности может служить следующий функционал: 


К=1 К=1 


где сх = соп8( Е [0, 1] - весовые коэффициенты, 5х — нормированные значения 
функций соответствия, вычисляемых для проверки степени близости потенциального 
решения по заданному К-му критерию маршрута. 

Чаще других в качестве критериев оптимальности траектории используются длина 
и гладкость маршрута движения, которые могут быть заданы функциями 51 и 52: 


—1 —1 


№, -—1 


№, -—1 
5: = т. —= > аб у,, У) ‚ 
1=0 


1=0 


где расстояние ((хь, хат, Уь Ур) = 1 при перемещении в соседнюю ячейку по гори- 
зонтали или вертикали, и ((х., хнл, Уь Ун1) = ^/ 2 — по диагонали; 


—1 
М,-2 С 
га 
5 = Уе 5 
11 


где 0; - угол между двумя линейными сегментами, соединяющими 1-ю ячейку 
маршрута, ©, — желаемый угол курса. 

К начальному или полученному множеству потенциальных решений применя- 
ются генетические операторы (скрещивание, мутация, спрямление и сглаживание), 
результатом работы которых является получение новых хромосом для последующего 
отбора среди них лучших решений для следующего поколения. Этот набор действий 
повторяется итеративно, пока полученное решение не будет удовлетворять заданному 
критерию. Такими критериями могут быть: минимальная длина маршрута, миними- 
зация времени перемещения в заданную точку и т.д. 

Другим известным подходом решения задачи управления мобильными роботами 
является использование нейронных сетей. Основным преимуществом использования 
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нейросетевого подхода в задачах планирования оптимальных маршрутов движения 
является параллельная обработка сигналов, которая реализуется самой архитектурой 
сети: объединением нейронов в слои и соединением нейронов различных слоев опре- 
деленным образом. 

Решение задачи планирования на основе нейронных сетей можно свести к сле- 
дующим основным этапам [5]: 

1) формализация задачи планирования; 

2) выбор топологии сети; 

3) отображение энергетических взаимодействий нейронов в сети в виде нейрон- 
ной карты (поверхности); 

4) расчет полной траектории в виде некоторой процедуры «восхождения» к вер- 
шине поверхности (цели). 

Условия применения нейросетевого подхода определяются формализацией задачи 
планирования. Используем следующие обозначения: К — мобильный робот, С — задан- 
ное рабочее пространство. Некоторый внешний источник (сенсорная система) непре- 
рывно обеспечивает систему планирования информацией Х об окружающей среде. 
На базе полученной информации определяется конфигурация заданного простран- 
ства С и расположение препятствий. Следует отметить, что точность определения кон- 
фигурации рабочего пространства зависит от технических возможностей сенсорной 
системы. Информация Х благодаря энергетическим взаимодействиям нейронов в сети 
отображается в виде нейронной карты Ч на нейронной области Г. Для создания 
нейронной карты необходимо реализовать волнообразное распространение энергии 
в сети, поэтому каждый нейрон взаимодействует только с соседними нейронами в 
пределах своего подмножества. Реализация предлагаемого подхода осуществлена на 
базе нейронной сети Хопфилда. 

Выбранная топология нейронной сети определяет вид формулы для расчета рас- 
стояния между нейронами в слое (функция расстояния), так, расстояние между нейро- 
нами Ти ] в описываемой сети есть норма евклидового пространства р (т, }): 


5% Е 58.0 
р, Л =УЧЙ-ИЛ, 
где [Пи [7] - векторы состояний 1-го и ]-го нейронов соответственно. 
Синаптическая функция выполняет взвешивание входного вектора нейронной 
сети. Для выполнения этой операции используется функция нормированного скаляр- 


ного произведения. Данная функция выполняет скалярное произведение весовой мат- 
рицы на каждый вектор входа, деленные на сумму элементов каждого вектора: 


У.Р 
и 
У 


где И - матрица весов, Р — вектор входа, р — элемент входного вектора. 
Непосредственно значения весов и «соседство» для каждого нейрона определяет 
функция /{. Это обычно убывающая функция: 


— если О<х<г 
0) = х , 


О если х=0 или х>г 


где г =1,5 — радиус нейронной области РЁ, х — вес связи. 
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Исходя из ортогональной топологии сети, примем г = 1,5, тогда веса для связей 
прямого действия в пределах нейронной области РЁ, а также веса собственных об- 


ратных связей нейронов будут установлены в 1, для диагональных $9 = 0, 7071. 
Получившиеся веса симметричны для всех Ги ] в пределах подмножества С, то есть 
хр =х()й. 

Дальнейшее решение задачи планирования определяется отображением энергети- 
ческих взаимодействий нейронов в сети в виде нейронной карты. Для этого координаты 
цели, а также информация об окружающей среде подаются на вход сети Хопфилда. 
Нейроны сети входят в состояние равновесия и принимают собственные значения энер- 
гии (в зависимости от функции активации). Взаимодействия нейронов построенной 
сети обусловлены динамикой и архитектурой самой сети, а также конфигурацией 
окружающего пространства и координатами цели, которая является точкой активации. 
Значения энергии нейронов на данной нейронной области (ландшафт активации) по- 
ступают на вход блока генератора траектории, который в свою очередь и выполняет 
расчет траектории. 

Реализация бортовых систем управления «болыпими» мобильными роботами 
на основе генетических алгоритмов или нейронных сетей не вызывает особых тех- 
нических затруднений, поскольку размеры роботов позволяют размещать на борту 
достаточно мощные аппаратно-программные комплексы, ресурсы которых позволяют 
реализовать в реальном времени сложные алгоритмы управления. В то же время на 
возможности бортовых вычислительных устройств микророботов накладываются более 
жесткие ограничения — размеры микророботов уже не позволяют размещать высоко- 
производительные аппаратно-программные управляющие комплексы. В этом случае 
перспективным подходом может стать использование нечетких алгоритмов, которые 
при аппаратно-программной реализации имеют достаточно низкие показатели затрат 
машинного времени. 

Решение задачи планирования на основе нечетких алгоритмов можно свести к 
следующим основным этапам [6]: 

1) определить входы и выходы создаваемой системы; 

2) задать для каждой из входных и выходных переменных функции принад- 
лежности; 

3) разработка нечетких правил выводов. 

За входные сигналы нечёткого регулятора можно принять следующие параметры: 
А - свободные области рабочей зоны; Ь — угловое отклонение от цели. Свободные 
области рабочей зоны А - это матрица, формируемая на основе поступающей инфор- 
мации от восьми датчиков, расположенных в каждом из 8 возможных направлений 
движения. Элементы матрицы А могут принимать значения «0» и «1», где «0» соот- 
ветствует свободной области, а «1» соответствует препятствию в рабочей зоне. Угловое 
отклонение от цели Ь — входная переменная, определяющая отклонение курса движе- 
ния мобильного робота от целевого направления. Выходными сигналами нечеткого 
регулятора являются: У — линейная скорость мобильного робота; & — направление 
движения мобильного робота. 

Входным и выходным сигналам соответствуют логико-лингвистические перемен- 
ные, значения которых определяется термами-множествами: отрицательное большое 
(МВ), отрицательное среднее (ММ), отрицательное малое (№) и т.д. 

На следующем этапе строится база знаний нечеткой системы, состоящая из про- 
дукционных правил и отражающая зависимость между входными и выходными тер- 
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мами-множествами. Для разрабатываемой нечеткой системы выбор нужного правила 
будет определяться угловым отклонением микроробота от цели и наличием свободных 
областей в рабочей зоне. Всего в базе правил определено 72 правила — по девять 
вложенных правил для каждого из восьми значений углового отклонения робота от 
цели (восьми возможных направлений движения). 

В базе правил в первую очередь выполняется поиск по переменной «цель», что 
позволяет эффективнее использовать вычислительные ресурсы бортовой микроЭВМ. 
Аналогично строятся базы нечетких правил управления для других возможных ситуа- 
ций расположения цели относительно робота (цель перед роботом и слева, цель перед 
роботом и справа, цель слева, цель справа и т.д.). 

Наиболее важной отличительной чертой алгоритмов планирования на основе 
нечеткой логики являются умеренные затраты машинного времени и оперативной 
памяти микроЭВМ. Вычислительные затраты также практически не зависят от размер- 
ности матрицы конфигурации рабочей зоны, а оптимизация используемого объема 
памяти микроЭВМ для больших размерностей рабочей области может быть достигнута 
отображением в матрице локальной зоны робота. 


Результаты моделирования 


Некоторые из результатов моделирования планирования перемещений одного 
робота в произвольной окружающей обстановке представлены на рис. 1. Рабочее прост- 
ранство размерностью 10х10 представляет собой область со статическими препят- 
ствиями. Заданы исходное (РТ) и целевое (ЦТ) положения робота. 

Как видно из рис. 1, нахождение траектории с наименьшим числом шагов робота 
в дискретной модели окружающей обстановки (рис. Та) обеспечивает использование 
нейросетевого подхода (рис. 16), в котором в качестве критерия оптимальности исполь- 
зуется длина траектории. В этом случае нейронная сеть формирует некоторую про- 
цедуру «восхождения» к вершине поверхности (цели). Направление на каждом расчетном 
шаге определяется максимальным градиентом по направлению от текущего нейрона 
1 до соседнего нейрона ]. Процесс повторяется для ]-го нейрона и так далее вплоть до 
того, пока не будет найден целевой нейрон и построена конечная траектория. 

Генетический подход также позволяет найти оптимальный по длине путь, при 
этом несколько большее число шагов (рис. 1в) связано с использованием в ГА опера- 
ции сглаживания для улучшения структуры хромосомы с точки зрения обеспечения 
гладкости траектории. Использование операции сглаживания позволяет избежать колес- 
ному роботу резких поворотов при движении. 

При использовании нечеткого подхода к планированию предполагается наличие 
сенсорной информации только в ближней окрестности робота. Естественно, что в этом 
случае использовать в качестве критерия оптимальности длину траектории для полной 
модели окружающей обстановки уже не представляется возможным (рис. 1г). С тем 
чтобы в какой-то мере компенсировать это, комплекс правил в базе знаний генерирует 
управление роботом так, чтобы его угловое отклонение от цели было минимальным 
и большую часть времени робот двигался прямолинейно к цели. Поэтому при состав- 
лении базы правил было принято два условия: если угловое отклонение от цели больше 
нуля, то робот останавливается и изменяет свою ориентацию так, чтобы двигаться 
прямолинейно к цели; если угловое отклонение от цели равно нулю, то робот разви- 
вает максимальную возможную скорость и прямолинейно движется к цели. 
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г) 
Рисунок 1 — Модель окружающей обстановки робота (а) и траектории движения, 
найденные НС (6), ГА (в) иНЛ (г) 


Общей чертой рассмотренных алгоритмов является необходимость дискретиза- 
ции, т.е. разбиения рабочей области на конечное число ячеек. Как правило, это квадраты, 
длина сторон Д5 которых выбирается из условия обеспечения алгоритмом бесконф- 
ликтного движения — исключения столкновений роботов между собой, столкновений 
со стационарными препятствиями, а также выход за пределы рабочего пространства. 
Величину шага дискретизации Л5 можно выбрать из следующего соотношения: 


АУ = т. ВЫ 


где Ги — минимальный из габаритных размеров робота, функционирующего в 
пределах рабочей области, или препятствий, расположенных в зоне движения роботов; 
п — эмпирический коэффициент шага дискретизации, характеризующий достижимую 
безопасность движения в заданной среде. Как показали результаты моделирования, 
при выборе величины коэффициента 1 в диапазоне 1,1-1,5 обеспечивается бесконф- 
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ликтное движение и эффективная работа рассмотренных интеллектуальных алгоритмов. 

Выбор шага дискретизации по предлагаемой выше формуле позволяет получить 
поисковое пространство наименьшего размера, при котором возможна реализация бес- 
конфликтного движения мобильных роботов, а значит, достигается эффективность 
работы алгоритма. Относительно невысокая точность решения задачи при таком под- 
ходе будет соответствовать грубой подсистеме генерации движений, которая при необ- 
ходимости может компенсироваться уже прецизионной подсистемой управления. 

Как показали результаты моделирования, для решения проблемы массового при- 
менения мобильных роботов в составе больших групп (микророботов), насчитывающих 
сто и более технических устройств, наиболее перспективным является использование 
методов планирования на основе нечеткой логики (проводилось исследование работо- 
способности алгоритмов при количестве роботов в группе до 1000). Сложность по- 
строения бортовой системы управления «отдельными» микророботами больших групп 
на основе генетических алгоритмов или нейронных сетей компенсируется необходи- 
мостью их бортовых систем реального времени на основе ограниченных по мощности 
вычислительных ресурсов. Поэтому, с учетом затрат машинного времени, в ходе экс- 
периментов был определен оптимальный размер группы для данных подходов: 50 и 
10 роботов в группе соответственно. 


Выводы 


В заключение отметим общие рекомендации по использованию рассмотренных 
интеллектуальных подходов. Из основных характеристик, обеспечивающих преиму- 
щества использования генетических алгоритмов в задачах планирования оптимальных 
маршрутов движения, можно выделить параллельность процесса поиска, вовлечение 
в соответствующую процедуру сразу большего числа потенциальных решений и 
больший полный охват пространства поиска. В отличие от методов оптимизации на 
основе нейронной сети в генетических алгоритмах не предъявляются особые требо- 
вания к целевой функции, не требуется информация о её градиенте, нет ограничений 
по сложности. Генетические алгоритмы способны обеспечить нахождение близкого 
к оптимальному маршрута даже при попадании в области локальных экстремумов 
функций пригодности. 

Важной особенностью методов планирования на основе нейронной сети является 
возможность аппаратной поддержки централизованной системы управления на базе 
стационарных вычислительных комплексов с использованием нейроускорителей, а 
также разработка распределенных децентрализованных систем с учетом аппаратной 
специфики бортовых комплексов. Поскольку нейронные сети обладают способностью 
быстро адаптироваться к изменениям, то становится возможным их использование в 
нестационарных средах с динамическими препятствиями с организацией пере- или 
дообучения в реальном времени. 

Основной характеристикой, обеспечивающей преимущества использования не- 
четких алгоритмов в задачах планирования, является их низкая требовательность к 
аппаратным ресурсам в сочетании с высокой скоростью отклика, как у классических 
регуляторов. К преимуществу нечеткого управления следует также отнести наличие 
библиотек с готовыми макетами для реализации на контроллерах. 
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Рфегепи! Арртоасйе; ю Мопоп Сотто[ ор МоБие Кобо! Базеа 
оп йе Тесйпо[ов1ез орзой Сотрийпе 


Тве агасе 415си$5ез Фе изе оЁ АШетгепе гурез оЁ пиеШоепЕ а12огиип$ Базе оп $0й 
сотрийпс {есВпо|о21е$, 1.е. агаЙсла| пеига! пебмуогК$, Га7ту 1051с ап4 сепейс ао $ 
Гог Фе пиретегнаНоп оЁ р1аппте ап тойоп сопёго| ор то Бе гоБо. ТВе зити]айоп 
тез; таке ассепЕ {0 Фе таш Теаиге$ оЁ Фе сопз14еге4 арргоасВез. Те ригрозе оЁ 1$ 
рарег 1$ ап оуегуле\ оЁ тойоп р!аппие зует Гог шобШе гоБо{$, уу/шсь 15$ Базе оп Ше 
тодегл пеШоеп( а1>огИип$. А15о, >62 фе таш Геабгез оЁ Фе р]аппте зузет 
ап тесоттеп4аНопз$ Гог изез оР тефо4$ ассог4те ю Ше гедитетеп Гог Ше зрее4 оЁ 
Фе а!еогифт, фе ацаШу оЁ Фе пафесюгу, Фе ауаПа БИиу оЁ зепзогу шогтайоп аге слуеп 
ш Фе агасе. 

Аз зво\п Бу зипи|айоп гези, ш а сазе \зпеп Фе рапише зузет аге изед 
ассог4те {о Месез{ отопр о шо Бе гобо5 (Бипаге4 ап тоге оЁ (есбилса| 4еу1сез$) фе 
110$ ргопл1$шо 1$ Фе изе оЁ тефоа$ оЁ р!аппте Базе оп ЁРл77у 1021с (2004 гезой \а$ 
отуеп ог фе питЬег оЁ гобо$ ш Фе отопр - пир ® 1000). Тве сотр ехиу оЁ Фе 
сопзгасйоп оЁ оп-Боаг4 сопио| зузет Гог плсгогобо5 аз асет оф ]агое огоирз У\УВеп 
зубет 15 Базе оп сепейс а1еогИтл$ ап пеига] пебмогк$ 1$ ащегттеа Бу Фе пее4 {ю 
пипр!етепё пет ш геа1 ите то4е уф фе Птце4 сарасйу оЁ сотршаНопа!| гезопгсез. 
ТрегеГоге, {аКшо ш®ю ассоипё фе тезилыме аБИиу оЁ оп-Боаг4 сопго] сотршег Фе 
орита!| этоир $12е 1$ Итие4 ап оо гези$ Гог Шезе арргоасВез$ аге асшеуе4 уПеп 
этопр соп$15$ 50 апа 10 гоБок5, гезресиуеу. 
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